基于NoSQL构建半结构化数据方法的研究与应用

基于NoSQL构建半结构化数据方法的研究与应用

作者:师大云端图书馆 时间:2023-11-24 分类:硕士论文 喜欢:1134
师大云端图书馆

【摘要】随着Web网络的快速发展,数据形式开始发生变化。传统的文件、关系型数据库等不同的数据存储方式对这一变化起到的一定的推动作用,但又渐渐不能满足日益增长的数据处理要求。按照数据结构划分,数据大致可以分为三类:(1)松散式数据:类如声音、图片等保存在传统文件中且没有严格结构的数据;(2)高度结构化的数据:这类数据具有高度的结构化,比如存储于传统关系型数据库表格中的数据;(3)介于前两者间的半结构化数据:这种数据隐含着部分结构或者不稳定的结构,但是又不如经过建模并存储于关系型数据库数据表中的数据具有高度的结构化。对于Web网络中的半结构化数据,研究人员提出了多种的描述理论和方法,相关的数据库存储技术也日益发展。其中,XML等交换数据格式的发展更是推动Web半结构化数据的应用与发展。同时,RDF作为语义网络的标准资源描述框架,其三元组模型为描述Web网络中的半结构化数据提供了一种很好的简单理论模型。另外,NoSQL作为一种自由模式的存储及管理方式,弥补了传统关系型数据库的不易水平扩展等缺点。本文研究的主要内容是如何对Web网络半结构化数据进行动态化的描述与存储。文中首先对Web网络中的半结构化数据的各种描述方法和存储方式进行了概述与研究,并指出其中主要面临的问题。论文的主要研究成果和创新点有如下几个方面:(1)提出RDF-JSON语义化描述方法:通过研究Web网络中半结构化数据的特点,结合JSON数据格式和RDF资源描述框架,并考虑实际工作应用中的数据形式,提出RDF-JSON这种描述Web网络中半结构化数据的方法。这种方法可以很好地兼容传统JSON数据,同时又可以很好的描述其数据的语义化。(2)利用MongoDB数据库实现动态化存储:分析和总结数据的动态化特点,并利用MongoDB数据库中自由存储模式的特性,实现数据的动态化存储。(3)提出多文档的存储方式:对存储数据进行预操作,进而提出多文档的存储方案,并建立相应的索引,从而提高数据的检索速率。(4)构建分享数据的应用。
【作者】刘朝敏;
【导师】严红平;
【作者基本信息】中国地质大学(北京),计算机科学与技术,2014,硕士
【关键词】半结构化数据;RDF-JSON;RDF;NoSQL;MongoDB;

【参考文献】
[1]邓德兴.侵犯网络虚拟财产犯罪的若干问题研究[D].吉林大学,法律,2013,硕士.
[2]齐郑,杨以涵.中性点非有效接地系统单相接地选线技术分析[J].电力系统自动化,2004,14:1-5.
[3]何熹.PP/PA6/碳系粒子/剑麻电磁屏蔽材料性能研究[D].华南理工大学,2013.
[4]李冰.微型永磁电器强电磁脉冲环境下工作特性研究[D].哈尔滨工业大学,电气工程,2013,硕士.
[5]李婧.严歌苓小说中的意象研究[D].西南交通大学,比较文学与世界文学,2013,硕士.
[6]金春立.我国商业银行海外并购绩效研究[D].浙江工业大学,2012.
[7]张双莹.何鹏盗窃案研究[D].黑龙江大学,法律,2013,硕士.
[8]张泽吾.论专利侵权诉讼中的等同原则[D].湘潭大学,经济法学,2003,硕士.
[9]张毓洁.论工作分解结构(WBS)在翻译项目规划阶段中的运用[D].上海外国语大学,翻译,2014,硕士.
[10]王振岳.高原高寒地带光缆线路的调研及维护技术的研究[A].中国通信学会通信线路委员会.中国通信学会2001年光缆电缆学术年会论文集[C].中国通信学会通信线路委员会:,2001:12.
[11]梁蕊.对异文化非语言交际的探究[D].西北大学,日语语言文学,2013,硕士.
[12]饶思贤,彭辉,周煜,潘紫微,岑豫皖.TP347H的高温蠕变-疲劳交互规律研究[J].机械工程学报.
[13]张元毅.基于Java EE的情报判研平台的设计与实现[D].吉林大学,软件工程,2014,硕士.
[14]周小芳.SY公司内部控制的研究[D].华东理工大学,工商管理(专业学位),2013,硕士.
[15]张德英.高中地理教学科际联系及策略研究[D].山东师范大学,学科教学(专业学位),2013,硕士.
[16]田晓梦.鄂西土家族宗教信仰心理研究[D].中南民族大学,宗教学,2013,硕士.
[17]周剑雄,高洁.基于数据库和数据挖掘技术的客户关系管理[J].计算机系统应用,2003,02:9-11.
[18]张漫.农田谷物产量空间分布信息采集、处理与系统集成技术研究[D].中国农业大学,2003.
[19]秦方.基于IMIA国际倡议的我国医学信息管理本科课程体系构建[D].华中科技大学,情报学,2013,硕士.
[20]郑庆锋.含重金属危险固体废物药剂稳定化处理及机理研究[D].浙江工业大学,2003.
[21]胡思略.灌区信息采集系统RTU的设计[D].哈尔滨理工大学,通信与信息系统,2012,硕士.
[22]张爱丽.丝蛋白矿化羟基磷灰石及丝蛋白纳米线作为药物缓释载体的研究[D].苏州大学,纺织材料与纺织品设计,2014,硕士.
[23]唐曦.国家治理,国家审计与国家经济安全[D].云南财经大学,会计(专业学位),2014,硕士.
[24]曾毅.纵连式轨道板垂向稳定性研究[D].西南交通大学,建筑与土木工程,2014,硕士.
[25]王寅.燃烧优化系统的研究与开发[D].华北电力大学,系统工程,2012,硕士.
[26]田帅.碳纳米管与PVA纤维复合增强的水泥基材料的制备与性能[D].重庆大学,材料工程(专业学位),2014,硕士.
[27]姚成,徐石明,桑林,叶雷.基于电网调度自动化系统实现备用电源自动投入[J].电力系统自动化,2009,24:75-77.
[28]彭婧孜.论19世纪法国空想社会主义的社会建设思想[D].浙江工商大学,马克思主义基本原理,2013,硕士.
[29]洪素娥.情境教学在高中文言文教学中的应用研究[D].山东师范大学,学科教学(专业学位),2013,硕士.
[30]陈晓若.我国证券投资基金和券商集合理财产品的持股偏好比较研究[D].南京大学,工业工程(专业学位),2013,硕士.
[31]方流.描述逻辑推理优化技术研究[D].浙江大学,2008.
[32]朱琬芳.A呼叫中心新员工流失原因与对策研究[D].华中科技大学,工商管理,2013,硕士.
[33]禹明延.频率副词“总(是)、老(是)”的汉韩比较研究[D].吉林大学,汉语言文字学,2014,硕士.
[34]张友德.我国新能源产业融资效率及影响因素研究[D].东北财经大学,会计学,2012,硕士.
[35]赖昱光.直流通道检修的安全风险量化评价指标与算法研究[D].华南理工大学,电力系统及其自动化,2014,硕士.
[36]李鑫.武汉地区普通高校保健体育课开展状况及对策研究[D].华中师范大学,体育教学,2013,硕士.
[37]葛羽嘉,吴朝晖.基于市场营销的新产品创新决策支持系统[J].计算机工程与设计,2001,05:5-9.
[38]杨帆.内蒙古典型草原风力发电场对鸟类影响的研究[D].内蒙古大学,生物工程,2014,硕士.
[39]黄惠玲.广州市海珠区城中村出租屋管理模式创新研究[D].兰州大学,公共管理(专业学位),2013,硕士.
[40]孙倩倩.数字媒体技术条件下的体验式展示设计[D].山东工艺美术学院,设计艺术学,2014,硕士.
[41]耿娆.推进农业产业化经营的融资研究[D].河北经贸大学,金融(专业学位),2014,硕士.
[42]张国山,刘蕾.基于动态补偿的矩形广义系统线性二次最优控制(英文)[J].自动化学报,2010,12:1752-1757.
[43]许鹭.新课程背景下高中历史人物教学的现状分析与对策研究[D].东北师范大学,课程与教学论,2012,硕士.
[44]王晓丹.带有拒绝工件的工期指派的排序问题[D].沈阳师范大学,应用数学,2014,硕士.
[45]秦卫.基于Web的车辆管理系统的设计与实现[D].电子科技大学,软件工程(专业学位),2012,硕士.
[46]王大蕾.成网条件下城市轨道交通OD分布预测模型研究[D].北京交通大学,交通运输规划与管理,2013,硕士.
[47]张超生.目标成本法及其案例研究[D].武汉大学,2003.
[48]施德泉.公路桥涵挤扩支盘桩的承载性能研究[D].中国地质大学(北京),地质工程,2013,硕士.
[49]吴军.非线性混合整数规划问题的差分进化算法研究[D].北方民族大学,计算数学,2014,硕士.
[50]许智华.SOX2、OCT4、β-连环蛋白、p120~(ctn)在乳腺癌中的表达及临床意义[D].山西医科大学,病理学与病理生理学,2013,硕士.

相关推荐
更多